其他
没想到国内大模型厂商又一次high起来,是因为OpenAI 断供!
整理 | 褚杏娟、华卫
6 月 25 日起,陆续有包括中国大陆在内的各国和相关地区 API 开发者在社交媒体上表示,他们收到了来自 OpenAI 的邮件,表示将采取额外措施停止其不支持的地区的 API 使用。
根据网上流传的邮件截图,OpenAI 表示:“根据数据显示,你的组织有来自 OpenAl 目前不支持的地区的 API 流量。从 7 月 9 日起,我们将采取额外措施,停止来自不在 OpenAI 支持的国家、地区名单上的 API 使用。”
“要继续使用 OpenAI 的服务,您需要在受支持的地区访问该服务。”在 OpenAI 给出的“支持访问国家和地区”名单上(https://platform.openai.com/docs/supported-countries),世界上大部分地区都可以使用 OpenAI,包括几乎整个西方、东欧大部分地区、南亚和大约一半的非洲,但中国大陆、中国香港、俄罗斯、朝鲜、伊朗等地均未在列。
而上述不受支持的中国、俄罗斯、朝鲜、伊朗四个国家,似乎“踩在” OpenAI 的雷达上已有一段时间。今年 2 月,这家人工智能公司宣布关闭了其声称由这四个国家的 "国家附属恶意行为者 "使用的账户,表示他们使用 ChatGPT 帮助进行网络钓鱼攻击和开发恶意软件。上个月底,OpenAI 打击了另一组来自中国、俄罗斯、伊朗和以色列的账户。
实际上,OpenAI 早先就对中国大陆地区的用户实行了注册门槛,限制了其对 ChatGPT 服务的访问权限。中国大陆的开发者群体在构建基于 OpenAI API 的衍生服务时,往往需要通过代理服务器或在海外部署反向代理机制。这不仅增加了运维成本,也无法保证服务的稳定性。
这次,OpenAI 的强制决策一出,便立刻引发了国内大模型厂商的回应,各厂商纷纷表示可以支持企业“无痛”迁移,并发布了不少吸引 OpenAI 用户使用其平台的激励措施。而根据多位行业专业人士的看法和预测,国内大模型行业内部此时也有更深层次的担忧与挑战悄然浮现。
“百模大战”首先作出反应的是智谱 AI。当天下午一点半左右,智谱 bigmodel.cn 推出了 OpenAl API 用户特别搬家计划,帮助用户切换至国产大模型,具体包括为开发者提供 1.5 亿 Token(5000 万 GLM-4 +1 亿 GLM-4-Air) 以及从 OpenAl 到 GLM 的系列迁移培训。对于高用量客户,智谱提供与 OpenAl 使用规模对等的 Token 赠送计划 (不设上限),以及与 OpenAl 对等的并发规模等。
当天下午四点半左右,百度智能云千帆推出了大模型普惠计划,即日起为新注册企业用户提供:
● 0 元调用:
文心旗舰模型首次免费,赠送 ERNIE3.5 旗舰模型 5000 万 Tokens 包,主力模型 ERNIE Speed/ERNIE Lite 和轻量模型 ERNIE Tiny 持续免费;
针对 OpenAI 迁移用户额外赠送与 OpenAI 使用规模对等的 ERNIE3.5 旗舰模型 Tokens 包。
● 0 元训练:免费模型精调训练服务
● 0 元迁移:零成本 SDK 迁移工具
● 0 元服务:专家服务(迁移 & 使用指导)
不过,百度智能云表示,以上优惠活动均在 2024 年 7 月 25 日 24 点前适用。
不到半小时后,阿里云紧接着宣布,将为 OpenAI API 用户提供最具性价比的中国大模型替代方案,并为中国开发者提供 2200 万免费 tokens 和专属迁移服务。据悉,通义千问主力模型 Qwen-plus 在阿里云百炼上的调用价格为 0.004 元 / 千 tokens,仅为 GPT-4 的 50 分之一。根据斯坦福最新公布的大模型测评榜单 HELM MMLU,Qwen2-72B 得分为 0.824,与 GPT-4 并列全球第四。
随后在当天六点 20 分左右,零一万物宣布发起了“Yi API 二折平替计划”,面向 OpenAI 用户推出了平滑迁移至 Yi 系列大模型的服务,并针对接入 OpenAI 的不同模型的用户,一一对应地提供了高模型性能且极具性价比的替换方案。
据介绍,目前注册使用 Yi API 的新客户,零一万物立即赠送 100 元额度;平台充值还将赠送 50% 到账额度,上不封顶,为用户提供更长线的优惠;任意充值即可享受 RPM/TPM 限速直升 Tier3,直达高级别的服务质量和超快响应速度。此外,零一万物 API 还将提供 Prompt 兼容调优服务支持,陪伴用户适配 Yi 系列大模型。
零一万物表示,在模型性能相近的同时,Yi-Large 的定价远低于顶配模型 GPT-4o。以 GPT-4o 的定价计算(取 Input 和 Output 均值为 Open API 价格),接入 Yi-Large 后使用成本可下降 72%;而对比 GPT-4 Turbo 的价格,用户接入 Yi-Large-Turbo 后使用成本可下降九成以上;对于简单任务的处理,Yi-Medium 的使用成本较 GPT-3.5-Turbo-1106 下降 66%。
此外,零一万物还可提供支持实时搜索的 Yi-Large-RAG,适用于需要结合实时信息进行推理的场景,以便用户基于自身需求选择更匹配的模型。
当日,AI Infra 厂商硅基流动则直接宣布开放 7 款大模型:SiliconCloud 平台的 Qwen2(7B)、GLM4(9B)、Yi1.5(9B)等开源大模型免费使用。SiliconCloud 是集合主流开源大模型的一站式云服务平台,目前已上架包括 DeepSeek-Coder-V2、Stable Diffusion 3 Medium、Qwen2、GLM-4-9B-Chat、DeepSeek V2、SDXL、InstantID 在内的多种开源大语言模型、图片生成模型,支持用户自由切换符合不同应用场景的模型。同时,SiliconCloud 提供开箱即用的大模型推理加速服务。
当天晚 8 点左右,腾讯云宣布,即日起,新迁移企业用户可免费获得腾讯混元大模型 1 亿 Tokens。目前,腾讯云提供混元 Pro、Standard、Lite 等多个不同版本和尺寸的模型,用户可任意选择。腾讯还将为新迁移企业用户提供免费专属迁移工具和服务,该福利截止 7 月 31 日 24 点前。
今日凌晨,百川智能也跟进宣布了“零成本迁移”的措施:免费赠送 1 千万 token、Assistants API 免费使用。另外,百川开设了专家技术群,表示专家随时答疑,五分钟即可完成 API 迁移。
据悉,百川智能前不久刚发布最新一代基座大模型 Baichuan 4,并推出成立之后的首款 AI 助手“百小应”。Baichuan 4 相较 Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过 10%,数学和代码能力分别提升 14% 和 9%。
一时的机会,更卷的将来中美之间日益紧张的关系可能是促使 OpenAI 决定打击不受支持的用户的一个因素。自特朗普执政以来,美国已经对中国实施了制裁和关税,包括拜登总统增加对中国芯片、电池和电动汽车的关税。
为此,中国也加大了实现技术自给自足的力度,规定其电信公司在 2027 年前停止使用英特尔和 AMD 的 CPU,并要求其汽车制造商在 2025 年前至少在国内采购四分之一的计算机处理器。
尽管 OpenAI 正计划阻止在中国的 API 访问,但这对中国公司来说,无疑是一个迅速填补即将到来的市场空白以获得更多用户的好机会。不过,之后国内其他厂商是否会跟进,目前尚不能确定。
有专家预测,OpenAI 主动“送生意”的做法,给了国内的大模型厂商喘气的机会,但后续可能就得被迫继续卷价格。这意味着,已经有些降温的“大模型价格战”或将再次“火热”。可以看出,国内大模型行业在机遇重重的同时,竞争也将进一步加剧。
正如百川智能 CEO 王小川所说,“我们不需要一千、一万个大模型,在没有价格战的时候,中国可能真的是上百、上千个大模型在进行。”
同时,有不少网友纷纷议论:部分国产大模型是否会因 OpenAI 的断服“现原形”。国产大模型中是否存在调用 OpenAI API 的这一问题暂且不论,目前根据各类大模型用户在公开平台发表的使用反馈来看,许多国产大模型的中文文本上处理能力并不弱于 ChatGPT ,在视频、图片等多模态方面有所不足,但整体来说影响有限。
不可否认的是,对于国内一批使用 OpenAI API 的开发者来说,影响是巨大的。还有人士对国内用户发出了“谨慎付费”的友善提醒,一些通过调用海外大模型 API 接口来提供服务的套壳网站,之后可能因高昂的站点迁移成本关停跑路。
此外,OpenAI 强制执行其不支持国家列表的访问政策,在对中国开发者产生负面影响的同时,也可能带来其他方面的双向后果。
根据 Reddit 上的一篇帖子,总部位于美国的云平台公司 Vercel 的用户如果通过 Vercel 的边缘网络访问 OpenAI,也会收到同样的 OpenAI 邮件。目前还不清楚这封电子邮件是否发送有误,但 Vercel 的边缘网络确实有一个位于香港的区域,与中国大陆一样不受 OpenAI 支持。
今日荐文
一群顶尖搜索人才如何2个月出货,还把GPU利用率干到60%!揭秘百川智能研发大模型这一年1个芯片顶英伟达3个?这个偏爱印度的创始人爆肝8年,终于等来抢英伟达泼天富贵的一天!
揭秘大模型技术在快手搜索的应用
华为盘古 5.0 强势登场:参数跃升万亿级,理解能力突破至感应 level,团队亲述幕后黑科技!
月之暗面被曝进军美国,产品、人才筹备中!阿里腾讯捧出的30亿美元独角兽终于要出海了